Alignment defiende a los LLM de ataques de inferencia de propiedades
Los ataques de inferencia de propiedades amenazan la privacidad en LLM. Aprende cómo el alignment con DPO y GRPO los mitiga sin reentrenar.
Los ataques de inferencia de propiedades amenazan la privacidad en LLM. Aprende cómo el alignment con DPO y GRPO los mitiga sin reentrenar.